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摘要 : 转 座 子 是 真 核 生 物 基 因 组 的 重要 组 成 成 分 。 为 了 人 研究 家 和 看 Bombyx mori 长 末端 重复 序列 (long terminal repeat, 
LTR) 逆转 录 转 座 子 的 分 类 及 进化 , 本 研究 采用 de novo 预测 和 同 源 性 搜索 相 结合 的 方法 , 在 家 和 大 基因 组 中 共 鉴 定 出 
了 38 个 LTR 道 转录 转 座 子 家 族 , 序列 长 度 占 整个 基因 组 的 0.64% , 远 小 于 先前 预测 的 11.8% , 其 中 有 6 个 家 族 为 
本 研究 的 新 发 现 。38 个 家 族 中 , 26 个 家 族 有 表达 序列 标签 (expression sequence tag, EST) 证据 ,表明 这 些 家 族 具 有 
潜在 的 活性 。 对 有 EST 证 据 的 6 个 家 族 和 没有 EST 证 据 的 5 个 家 族 用 RT-PCR 进行 了 组 织 表 达 谱 实验 , 结果 表明 这 
11 个 家 族 在 一 些 组 织 中 有 表达 , 这 进一步 证 实 了 这 些 家 族 具 有 转录 活性 , 基于 此 我 们 推测 家 看 中 大 部 分 的 LTR 2 
转录 转 座 子 家 族 很 可 能 具有 潜在 活性 。 对 转 座 子 的 插 信 时间 进行 估计 , 结果 表明 绝 大 部 分 元 件 都 是 最 近 1 百 万 年 内 
插 和 人 到 家 乔 基 因 组 中 的 。 我 们 还 比较 了 黑 腹 果 量 Drosophila melanogaster, K) tk EERE Anopheles gambiae FIA B. 
mori 中 Ty3/Gypsy 超 家 族 分 支 的 差异 , 结果 表明 不 同 枝 在 不 同 昆虫 中 有 着 不 同 的 扩张 。 家 乔 中 LTR 逆转 录 转 座 子 的 
鉴定 和 系统 分 析 有 助 于 我 们 理解 逆转 录 转 座 子 在 昆虫 进化 中 的 作用 。 

关键 词 : A; 基因 组 ; 转 座 元 件 ; LTR 逆转 录 转 座 子 ; 系统 发 育 分 析 ; 组 织 表 达 谱 
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Characterization, classification and phylogenetic analysis of long terminal 


repeat retrotransposons in the silkworm, Bombyx mori 
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Abstract: In eukaryotes, transposable elements (TEs) constitute a large fraction of a genome. TEs are 
usually classified into two classes based on their transposition mechanisms. Class | elements use an RNA- 
mediated mode of transposition, while class [[ elements (transposons) use a DNA-mediated mode of “ cut 
and paste” transposition. Class | elements are further divided into two subclasses: the elements that are 
characterized by long terminal repeats ( LTR retrotransposons ) and the elements that lack terminal repeats 
(non-LTR retrotransposons ) In order to reveal the classification and evolution of LTR retrotransposons, we 
identified LTR retrotransposons in the domesticated silkworm (Bombyx mori) using de novo and homology 
search approaches and found 38 families in the silkworm genome, of which 6 families are novel. The 
sequences of these families constitute 0.64% of the whole genome, which is much less than that previously 
reported. We also found that 26 of 38 families have EST evidence, implying that they had potential activity. 
Then RT-PCR was performed to validate the expressions of 11 families (6 families have EST evidence and 5 
families have no EST evidence), and the results showed that these 11 families were expressed in some 
tissues , further supporting their transcriptional activities. Based on these results, we speculated that most of 
LTR retrotransposon families in the silkworm genome have potential activity. We estimated the insertion time 
of LTR retrotransposons, and found that most of them were inserted into the silkworm genome within the past 
million years. A comparison of Ty3/Gypsy superfamily in Drosophila melanogaster, Anopheles gambiae and 


B. mori showed that this superfamily experienced different expansion patterns. Given the importance of LTR 
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retrotransposon activity in the evolution of other genomes, our results provide some insights into the roles of 


LTR in insect genome evolution. 


Key words: Silkworm (Bombyx mori) ; genome; transposable elements; LTR retrotransposons; phylogenetic 


analysis; tissue expression profile 


转 座 子 存在 于 大 部 分 真 核 生 物 基因 组 中 , 它们 
是 基因 组 的 重要 组 成 成 分 。 例 如 , 转 座 子 占 了 人 类 
基因 组 的 45% 以 上 (International Human Genome 
Sequencing Consortium, 2001) , 果 晶 基因 组 的 5.3% 
(Quesneville et al., 2005), A Æ 2 Al H KJ 35% 
( Osanai-Futahashi et al., 2008) 。 根 据 转 座机 制 的 不 
同 , 转 座 子 可 以 分 为 两 大 类 : 第 一 类 是 逆转 座 子 ， 
通过 RNA 媒介 进行 转 座 ; 第 二 类 是 DNA 转 座 子 ， 
CAA pÚ BY UJ IDH BH BJ BL il BË 47 Fe BE ( Finnegan, 
1989) 。 其 中 逆转 座 子 又 可 以 根据 序列 两 端 是 否 存 
在 长 未 端 重复 序列 (long terminal repeat, LTR), 分 
为 LTR 逆转 录 转 座 子 和 Non-LTR 逆转 录 转 座 子 。 
目 主 的 Non-LTR 也 称 为 长 散在 核 元 件 (interspersed 
nuclear elements, LINEs) ， 非 自主 的 Non-LTR 称 为 
短 散 在 核 元 件 (short interspersed nuclear elements, 
SINEs) LINEs 负责 SINEs 的 转 座 ( Ohshima et al., 
1996), 

LTR 逆转 录 转 座 子 最 明显 的 特征 是 在 其 $ 和 
3 ' 端 有 一 对 长 未 端 重 复 序列 LTR, 长 度 从 100 bp 到 
5 kb 不 等 (Kumar and Bennetzen, 1999), LTR 在 许 
多 情况 下 以 5’-TG-3' Ate aR, A 5 -CA-3 为 终止 。 
另外 , 在 邻近 5'LTR 的 下 游 区 域 , 有 一 段 十 几 bp 
长 的 序列 ,此 序列 和 tRNA 的 3’ 末端 反问 互补 ,是 
反 转 录 起 始 引 物 tRNA 的 结合 位 点 ， 称 为 PBS 
(primer binding site) 。 同 样 地 , Œ 3'LTR 的 上 游 附 
jr, 也 有 一 段 十 几 bp 长 的 序列 , 负责 引导 DNA 链 
的 复制 ， 由 于 其 宣 集 嘿 哈 ， 因此 称 为 PPT 
(polypurine tract), EMR RUE PH BRA. 
FE LTR 逆转 录 转 座 子 的 内 部 区 域 , MN 36 2484 2810533: 
转录 所 需 酶 的 基因 (如 : gag 和 pol), HP pol 编码 
重 日 酶 (protease)、 整 合 酶 (integrase)、 逆 转录 转 座 
酶 (reverse transcriptase ) 和 RNA B# H (RNase H) 
(Kumar and Bennetzen, 1999) , LTR 逆转 录 转 座 子 
采用 的 是 “拷贝 -复制 ”的 机 制 , 在 插入 位 置 形 成 4 ~ 
6 bp 的 靶 位 点 重复 (target site duplication, TSD) 
(Wicker et al.，2007 ) 。 它 们 的 扩 增 会 给 基因 组 带 
来 显著 的 影响 ,如 增加 基因 组 的 复杂 性 ( Hawkins et 
al., 2006; Piegu et al., 2006), 。 此 外 ，LTR 逆转 录 
转 座 子 也 参与 基因 的 调控 和 新 基因 产生 等 过 程 


( Ganko et al., 2003; Wang et al., 2006) 。 

在 家 看 基因 组 序列 公布 之 前 , 已 鉴定 出 一 些 
LTR 逆转 录 转 座 子 ， 如 : mag (Michaille et al., 
1990), Pao ( Xiong et al., 1993), Kabuki ( Abe et 
al., 2000) , Kamikaze 和 Yamato( Abe et al., 2001 ) 
等 。 并 有 研究 表明 家 看 中 LTR 道 转录 转 座 子 可 以 
分 为 3 个 主要 的 超 家 族 : Tyl-copia, Ty3-gypsy 和 
Pao-like (Abe et wjl.，2001 ) 。 家 看 基因 组 框架 图 公 
布 (Xia et al., 2004) 以 后 ,Xu 等 (2005) 利用 LTR_ 
STRUC (McCarthy and McDonald, 2003 ) 对 家 在 中 的 
LTR 逆转 录 转 座 子 家 族 进行 了 系统 的 鉴定 , 共 鉴 定 
出 了 29 个 家 族 , 分 别 属 于 Copia-like, Gypsy-like 和 
Pao-Bel 3 个 超 家 族 , 序列 长 度 占 整个 基因 组 序列 的 
11.8%; AEF SAH EST 数据 , 作者 还 发 现 只 
有 1 个 家 族 有 EST 证 据 , 因此 推测 在 家 看 基因 组 中 
大 部 分 的 LTR 逆转 录 转 座 子 失去 了 活性 。 而 对 转 
座 子 进行 严格 准确 的 分 析 需 要 高 质量 的 序列 
( Kaminker et al., 2002 ) , 2008 年 中 日 研究 小 组 联合 
发 布 的 家 看 基因 组 精细 图 为 深入 分 析 家 看 基因 组 中 
的 转 座 子 提 供 了 可 能 (The International Silkworm 
Genome Consortium ，2008 ) 。 本 研究 采用 de novo Fil 
测 和 同 源 性 搜索 相 结 合 的 方法 对 家 看 中 的 LTR 逆转 
录 转 座 子 家 族 进 行 了 鉴定 、 分 类 和 系统 发 育 分 析 。 
家 看 中 LTR 逆转 录 转 座 子 的 鉴定 和 分 析 有 助 于 我 们 
理解 逆转 录 转 座 子 在 昆虫 进化 中 所 起 的 作用 。 


1 材料 与 方法 


1.1 试 虫 和 主要 试剂 

KEME ANE” 由 西南 大 学 家 看 基因 库 提 供 ， 
幼虫 在 恒温 25%C ,自然 光 周 期 条 件 下 ,以 新 鲜 桑 叶 
饲养 。Trizol AAAI A F Invitrogen 公司 ，M-MLV 
反 转 录 试 剂 合 和 RNase-Free DNase IJ H Promega 
公司 ，TransTaq DNA Polymerase High Fidelity Ij ËI 
于 全 式 金 公司 。 
1.2 LTR 逆转 录 转 座 子 的 鉴定 及 家 族 分 类 

家 春 全 基因 组 核 车 酸 序列 下 载 自 SilkDB (Duan 
et al., 2010)。 目 前 , 基于 LTR 逆转 录 转 座 子 的 特 
征 , 已 发 展 出 许多 在 全 基因 水 平 上 对 LTR 逆转 录 转 
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座 子 进行 鉴定 的 程序 (Bergman and Quesneville, 
2007) 。 其 中 de novo 预测 方法 有 LTR _ STRUC 
(McCarthy and McDonald, 2003), LTR _ FINDER 
(Xu and Wang, 2007), MGEscan-LTR (Rho et al., 
2007), LTRharves ( Ellinghaus et al., 2008) 和 
LTRdigest (Steinbiss et al., 2009) 等 。 我 们 利用 LTR 
_STRUC (McCarthy and McDonald, 2003 ) 和 LTR _ 
FINDER (Xu and Wang, 2007 ) 进行 全 基因 组 预测 。 
另外 ， 从 Repbase Update (Jurka et al., 2005) ) 和 
NCBI 核酸 数据 库 下 载 已 报道 的 家 看 LTR 逆转 录 转 
座 子 序列 , 并 与 从 头 预测 结果 进行 比较 ,去 除 元 余 
序列 。 对 于 得 到 的 序列 , 用 EMBOSS-6.3.1 (Rice 
et al., 2000) 软件 包 里 的 getorf 提取 开放 阅读 框 , 并 
用 Pfam (Finn et al., 2010) 在线 预测 其 中 的 逆转 录 
转 座 酶 及 其 他 和 蛋白 结构 域 。 我 们 把 能 预测 到 相关 生 
日 结构 域 的 序列 称 为 全 长 LTR 逆转 录 转 座 子 。 

对 于 上 述 得 到 的 结果 ,首先 根据 逆转 录 转 座 酶 
区 域 与 Pfam (Finn et al., 2010) 中 Peptidase _ A17 
(PF05380), RVT_1 ( PF00078) 和 RVT_2 ( PF07727 ) 
的 同 源 性 分 为 不 同 超 家 族 。 对 于 没有 同 源 性 的 全 长 
LTR 逆转 录 转 座 子 ,用 Censor ( Kohany et al., 
2006) 根 据 与 已 报道 序列 的 相似 性 分 为 不 同 超 家 
族 。 然 后 根据 家 族 间 LTR 的 相似 性 (相似 度 和 覆盖 
度 在 90% 以 上 归 为 一 个 家 族 ) 分 为 不 同 的 家 族 。 
LTR 逆转 录 转 座 子 的 结构 特征 用 LTR_FINDER ( Xu 
and Wang, 2007) 在 线 预 测 。 

1.3 各 家 族 全 长 (full-length) 和 单独 (solo) 元 件 的 
鉴定 及 家 族 找 贝 数 鉴定 

提取 各 家 族 的 LTR 序列 ,用 NCBI-BLAST 
( Altschul et al., 1997 ) 对 家 看 基因 组 进行 同 源 性 搜 
R, 对 于 覆盖 度 在 50% 以 上 , 相似 度 在 80% 以 上 的 
Hit 作为 一 个 拷贝 , 从 而 得 到 各 家 族 LTR 的 拷贝 数 。 
同一 家 族 的 LTR 拷贝 , 看 位 于 同一 Scaffold E, H. 
相距 在 10 kb LAA, 则 用 PERL 脚本 提取 两 LTR 及 
内 部 序列 , 此 序列 也 定义 为 全 长 LTR 逆转 录 转 座 
f, 用 于 第 1. 5 市 家 族 插 入 时 间 的 估计 , 其余 的 
LTR 拷贝 , 则 为 此 家 族 的 solo LTR, 

各 家 族 找 贝 数 的 鉴定 采用 RepeatMakser (Smit, 
AFA, Hubley, R & Green, P. RepeatMasker Open-3. 
0. 1996 — 2010. http://www. repeatmasker. org) ， 搜 
索引 人 警 为 Abblast ( Gish, W. 1996 - 2009. http:Z/ 
blast. advbiocomp. com) ， 所 用 的 库 为 各 家 族 全 长 序 
列 的 LTR 序列 和 内 部 序列 集合 , 搜索 模式 为 默认 模 
式 。 统 计 各 家 族 的 拷贝 数 , 并 统计 LTR 逆转 录 转 座 


子 占 各 染色 体 以 及 全 基因 组 的 比例 。Scaffolds 在 染 
色 体 上 的 定位 信息 参照 SIkDB (Duan et al., 
2010 ) 。 
1.4 序列 比 对 及 系统 发 生 分 析 

用 HMMER (http://hmmer. org/ ) 本 地 搜索 家 
看 中 不 同 LTR 家 族 全 长 序列 的 逆转 录 转 座 酶 区 域 ， 
从 NCBI 下载 已 报道 的 其 他 物种 的 LTR 逆转 转录 转 
ET, 并 用 HMMER 本 地 搜索 其 中 的 逆转 录 转 座 酶 
KiRo DRIE ARIY IH Muscle (Edgar, 
2004 ) 进行 比 对 , 在 MECA4 (Tamura et al., 2007 ) 
中 用 Neighbor-Joining 法 构建 系统 发 育 树 ，Bootstrap 
重复 次 数 为 1 000。 
1.5 LTR 逆转 录 转 座 子 插入 时 间 的 估计 

在 逆转 录 过 程 中 ，LTR 逆转 录 转 座 子 的 两 条 
LTR 是 由 单一 模板 合成 而 来 的 , 因此 在 整合 进 基因 
组 时 , 它们 在 DNA 序列 上 是 相同 的 。 如 果 已 知 宿 
主 的 核 车 酸 蔡 换 速 率 , 就 可 以 通过 计算 同一 转 座 子 
两 端 LTR 的 分 化 度 来 估计 转 座 子 的 插入 时 间 
(SanMiguel et al., 1998; Bowen and McDonald, 
2001), 。 对 于 每 个 家 族 中 的 全 长 LTR 逆转 录 转 座 
子 , 提取 LTR 序列 , 用 Muscle (Edgar, 2004 ) 进行 
比 对 , 使 用 MEGA4 (Tamura et al., 2007) 计算 分 化 
RE, 用 公式 7=K/2r 估计 插入 时 间 , 其 中 天 即 为 分 
化 度 , r=1.56 x10 (Li, 1997). 
1.6 LTR 人 逆转 录 转 座 子 的 插入 含 好 性 和 转录 活性 
分 析 

根据 LTR wi Fe ae Fe E T A AK Be TE ESE A E 
Scaffold 上 的 位 置信 息 , 用 PERL 脚本 统计 转 座 子 的 
插入 区 间 , 并 与 随机 序列 的 插入 区 间 进 行 比较 。 
EST 序列 下 载 于 SilkDB (Duan et al., 2010), 用 
NCBI-BLASTN ( Altschul et al., 1997) 进行 同 源 性 搜 
R EST 序列 获得 各 家 族 的 EST 证 据 。 

取 5 龄 第 3 天 家 看 幼虫, 解剖 分 离 头 、 血 液 、 
马 氏 管 、 丝 腺 、 中 肠 、 生 殖 腺 和 脂肪 体 等 组 织 和 器 
E, 液 须 速冻 后 保存 于 -80Y 备用 , 按照 Trizol 试 
剂 盒 说 明 书 提取 RNA, 在 反 转 录 前 用 RNase-Free 
DNase 消化 去 除 基因 组 DNA 污染 , 用 M-MLV 反 转 
录 试 剂 盒 反 转 录 成 cDNA。 根据 与 Yokozuna, 
Otora, Gypsy-2_BM, Kabuki, Kimono 和 Moriya 家 族 
有 同 源 性 的 EST 序列 和 Copia-1_BM ，Copia4_BM， 
Gypsy-3_BM, Gypsy-4_BM 和 Nemawashi 序列 ， 用 
Primer 5. 0 软件 设计 引物 , 引物 由 生 工 生物 工程 (上 
海 ) 有 限 公 司 合成 , 各 家 族 的 引物 序列 及 退火 温度 
如 表 1 所 示 。 
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R1 本 研究 所 用 引物 列表 


Table1 Primers used in this study 


话 或 iS ed BE (°C 
| Tea ee 
Primer sequences 

or gene temperature 
Yokozuna F; GTAAACATTCCATCACCATC 46 
R: CTICCTATAAATCAGTCCCT 
Otora F: AGGTGCTGGAACTCTTGCTT 53.7 
R; ACGGGATTACAGTCACTCATTT 
Gypsy-2_BM F; CGAAATAGAAGGCAAAGAGG 52.8 
R; ACGAGGAGGTTGTTCAGGTT 
Kabuki F; CTGACAGATACCCTATTCCTCG 54 
R; AAGGCTGAGTTAGGTAGATGC 
Kimono F: GIGCTTGGTTCGCATGTGTT 55, 3 
R: GGTGAAATCTTGCTCAGGGA 
Moriya F: TTTGGCGGTTCGTTCTTTGC 59.5 
R; GGATTTTCCAACTCCACCCG 
Copia-1_BM F: GAAAGGGCACCGATTATGAG 56 
R; GTAACCAGTGGACGACTTACGAT 
Copia4_BM F: ATTCACCCTAACAAACGCTTCC 58 
R; TTGGACTGCGGTGAGTATGG 
Gypsy-3_BM F; CITTGCTGAACCTGCTCCAC 56 
R; TGTATTCCATTAGGGCGTCA 
Gypsy-4_BM F. GCAACCACTCGCCTTCTICT 57.5 
R; GTAGCGGTCCAATCAAATCAAT 
Nemawashi F; AATCAGATACCAACAGCGGAGGAG 61 
R; GATGGGAAGCTTTAACCGAACC 
BmActin3 F: AACACCCCGTCCTGCTCACTG 60 
R; GGGCGAGACGTGTGATTTCCT 


分 别 以 家 看 组 织 cDNA 为 模板 进行 PCR 扩 增 ， 
扩 增 条 件 : 94C 3 min; 94° 40 s; 退火 温度 40 s; 
72% 1 min/kb; 28 个 循环 ; 72° 10 min, BmActin 3 
基因 作为 参照 , 退火 温度 见 表 1, 28 个 循环 。 阴 性 
对 照 以 反 转 录 前 的 RNA 为 模板 扩 增 BmActin 3, H 


2.5 


2.0 


比例 Proportion (%) 


= es q m _ 


增 条 件 同上 。 


2 ZA 


2.1 家 看 基因 组 中 LTR 逆转 录 转 座 子 的 鉴定 和 家 
族 分 类 

采用 de novo 预测 和 同 源 性 搜索 相 结 合 的 方法 ， 
FEAR AEA IA ZA EEE Hy 38 个 LTR 逆转 录 转 座 子 
家 族 ( 表 2) ,其 中 Copia 超 家 族 有 6 个 家 族 ，Cypsy 
超 家 族 有 20 个 家 族 ，Bel 超 家 族 有 12 个 家 族 。 有 6 
个 家 族 为 本 研究 新 鉴定 的 , 分 别 命 名 为 Copia-3 _ 
BM, Copia-4 _ BM, Gypsy-8 _ BM, Gypsy-10_ BM, 
Gypsy-11_BM 和 Gypsy-12_BM。 各 家 族 的 结构 特征 
由 LTR_FINDER 在 线 预 测 (Xu and Wang, 2007) , 
结果 见 表 2 所 示 。 从 表 2 可 以 看 出 , ZA LTR 逆转 
录 转 座 子 的 TSD 长 4 ~6 bp, 38 个 家 族 中 的 37 个 
都 具有 典型 的 双核 苷 酸 ， 和 先前 研究 的 结果 是 一 臻 
的 (Xu et al., 2005), LTR 的 长 度 在 100 ~ 500 bp 
之 间 。Gypsy 超 家 族 的 Gypsy-2 家族 拷贝 数 最 多 ， 
达到 了 1 312 个 ; Copia 超 家 族 的 Copia-3 家 族 拷贝 
数 最 少 , 只 有 20 个。 
2.2 LTR 刻 转 录 转 座 子 的 分 布 及 比例 

根据 Scaffold 在 染色 体 上 的 定位 信息 ， 把 
Scaffold 序列 定位 到 不 同 的 染色 体 上 , 未 能 定位 的 
Scaffold 归 为 未 知 。 用 RepeatMakser ( Smit, AFA, 
Hubley, R & Green, P. RepeatMasker Open-3. 0. 
1996 — 2010. http://www. repeatmasker. org) 统计 出 
LTR 逆转 录 转 座 子 在 各 染色 体 上 所 占 的 比例 ,结果 
如 图 1 BRAN. RRHH, LTR 逆转 录 转 座 子 在 不 同 
染色 体 间 的 分 布 没 有 明显 差异 。 家 看 中 LTR 逆转 
录 转 座 子 占 整 个 基因 组 的 0.64% , 远 小 于 先前 预测 
的 11.8% (Xu et al., 2005) 。 


图 1 LTR 逆转 录 转 座 子 在 各 染色 体 上 的 分 布 比 例 


Fig. 1 


The distribution of LTR retrotransposons on different chromosomes 


chrl -28 ; 染色 体 编号 Chromosome no.; Unknown: 未 定位 到 染色 体 Not mapped to chromosome; Total; LTR 逆转 录 转 座 子 占 整个 基因 组 的 比例 


Proportion of LTR retrotransposon in the genome. 
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2.3 ER LTR 逆转 录 转 座 子 的 系统 发 育 分 析 

用 本 文 鉴定 的 和 已 报道 的 其 他 物种 的 LTR 逆 
转录 转 座 子 的 转 座 酶 序列 , 构建 系统 发 育 树 ， 如 图 
2 所 示 。 家 看 中 的 LTR 逆转 录 转 座 子 主要 分 为 3 个 
类 群 ( 超 家 族 ), 分 别 为 Bel/Pao, Gypsy 和 Copia, 
系统 发 育 分 析 的 结果 与 2.1 市 的 结果 是 一 致 的 , 这 
表明 我 们 鉴定 和 分 类 的 家 大 LTR 家 族 是 可 信 的 。 在 
Bel/Pao, Gypsy 和 Copia 3 个 超 家 族 中 ，Gypsy 家 族 
在 昆虫 基因 组 中 最 多 ( Kapitonov and Jurka, 2003; 
Tubio et al., 2004; Xu et al., 2005) 。 根 据 逆 转录 转 
座 酶 、RNA Hj H 和 整合 酶 的 氨基 酸 区 域 , ER hi 
Gypsy 超 家 族 可 以 分 为 6 PAK, 分 别 为 : CsRnl， 
Gypsy, Mag, Mdgl, Mdg3 和 Osvaldo (Tubio et al., 
2004). Wy J PABA Ae ze 4 Gypsy 家 族 的 系统 发 育 关 
A, 我 们 用 家 看 中 的 和 已 报道 的 其 他 物种 的 Gypsy 
家 族 构 建 了 系统 发 育 树 ， 如 图 3 所 示 。 从 图 中 可 以 
看 出 , 家 看 中 的 CsRnl RRB, 有 7 个 家 族 , 其 次 
是 Gypsy 校 , 有 5 RIK, Mag 和 Mdg3 校 各 有 2 个 
家 族 , 缺少 Mdgl 和 Osvaldo 枝 。 虽 然 Bootstrap 值 
低 , 但 是 Noguchi 和 Cyclops 聚 为 一 枝 , 图 2 中 也 有 
同样 的 绪 采 。 这 表明 Noguchi 可 能 属于 Cyclops $- 
2.4 各 家 族 插入 时 间 的 估计 

根据 LTR 逆转 录 转 座 子 两 端 LTR 的 分 化 度 ， 
对 各 家 族 的 全 长 LTR 元 件 进行 插入 时 间 佑 计 , 结果 
如 图 4 所 示 。 由 图 中 可 以 看 出 , 绝 大 部 分 家 族 的 大 
部 分 元 件 估计 的 插入 时 间 都 在 0 ~1 个 百 万 年 , K 
HH LTR 逆转 录 转 座 子 是 最 近 插入 到 家 和 奏 基 因 组 中 
的 。 值 得 注意 的 是 ，Cypsy-2_BM 的 全 长 拷贝 最 多 ， 
有 88 个 拷贝 , 约 占 所 有 家 族 中 全 长 拷贝 数 的 259% 
(所 有 家 族 全 长 拷贝 数 为 338) , FF AIX 88 个 拷贝 
分 布 在 不 同 的 插入 时 间 佑 计 区 间 内 (图 4)。 
2.5 LTR 刻 转 录 转 座 子 的 插入 偶 好 性 和 转录 活性 
分 析 

为 了 预测 LTR 逆转 录 转 座 子 可 能 的 转录 活性 ， 
我 们 用 鉴定 的 LTR 逆转 录 转 座 子 家 族 的 代表 序列 
去 搜索 EST FE, 发 现 26 个 家 族 的 代表 序列 与 EST 
序列 有 相似 性 , 这些 家 族 分 别 是 : Copia-2 _ BM, 
Copia-3_BM, Otora, Yokozuna, Gypsy-2_BM, Gypsy- 
6_BM, Gypsy-8_BM, Gypsy-9_BM, Gypsy-10_BM, 
Gypsy-11 _ BM, Cygnus, Judo, Kabuki, Noguchi, 
Suzuka, BEL-1, Inoki, Kamikaze, Kenta, Kimono, 
Kokubaru, Lyra, Moriya, Pao, Yamato 和 Yokohama, 
这 表明 这 些 家 族 在 家 看 中 可 能 具有 潜在 的 转录 
活性 。 


为 了 进一步 阐明 家 看 中 LTR 逆转 录 转 座 子 的 
活性 , 我 们 在 3 个 超 家 族 中 各 选取 拷贝 数 较 多 和 和 较 
少 的 6 个 有 EST 证 据 的 家 族 和 5 个 没有 EST 证据 
的 家 族 , 用 RT-PCR 进行 组 织 表 达 谱 分 析 , 结果 如 
图 5 所 示 。 从 图 中 可 以 看 出 , 有 EST 证 据 的 家 族 
Yokozuna, Otora, Gypsy-2_BM, Kabuki, Kimono 和 
Moriya 在 某 些 组 织 中 有 表达 ,其 中 Otora 家 族 只 在 
卵巢 中 有 少量 表达 ， 而 Yokozuna, Kabuki 和 Moriya 
3 个 家 族 在 精 巢 中 的 表达 量 要 高 于 卵巢 中 的 表达 
量 , 另外 值得 注意 的 是 6 个 家 族 在 精 卵 梨 和 丝 腺 中 
的 表达 要 相对 集中 ; 对 于 无 EST 证 据 的 家 族 Copia- 
1_BM, Copia-3_BM, Gypsy-3_BM, Gypsy4_BM 和 
Nemawashi， 我 们 仍然 发 现 有 表达 的 证 据 ,， 如 Gypsy- 
4_BM 和 Nemawashi 家 族 在 个 别 组织 有 少量 的 表达 ， 
而 Copia-1_BM Copia-3_BM 和 Gypsy-3_BM 主要 在 
精 卵 巢 、 丝 腺 和 血液 中 表达 。 

用 PERL 脚本 比较 了 转 座 子 和 随机 序列 的 插入 
区 间 分 布 , 结果 表明 LTR 逆转 录 转 座 子 倾 问 于 插 人 
到 基因 间 区 (CC = 674.480; df=1; P <0.0001 ) 。 


3 讨论 


家 和 看 作为 鳞 却 目 昆 虫 的 模式 生物 ,其 精细 基因 
组 序列 已 于 2008 年 公布 , 先前 的 研究 表明 , 转 座 子 
序列 大 约 占 整个 家 看 基因 组 的 35% ( Osanai- 
Futahashi et al.，2008 ) ,高 于 黑 腹 果 晶 Drosophila 
melanogaster (5.3% ) (Quesneville et al., 2005) , PJ 
HEF F ËY Anopheles gambiae (16% ) (Holt et al., 
2002) , EFIR KIF EX Aedes aegypti (47% ) (Nene 
et al., 2007) 。 家 看 基因 组 中 包含 丰 定 而 多 样 的 转 
座 子 (Osanai-Futahashi et al., 2008) , KEZE XÈ 
研究 昆虫 转 座 子 很 好 的 模式 生物 。 

本 研究 采用 de novo 和 同 源 性 搜索 相 结合 的 方 
法 , 在 家 和 在 基因 组 中 共 鉴 定 出 38 个 LTR 逆转 录 转 
座 子 家 族 ( 表 2) ,其 中 有 6 个 家 族 为 新 鉴定 的 。 对 
这 38 个 家 族 进行 了 全 基因 组 拷贝 数 搜索 , 发现 家 
得 中 LTR 逆转 录 转 座 子 占 整个 基因 组 的 0. 64% , 
这 一 比例 远 小 于 先前 报道 的 11. 8% (Xu et al., 
2005 ) 。 先 前 的 结果 发 现 BmRT29_Kabuki 占 了 整个 
LTR 逆转 录 转 座 子 的 90% 以 上 (Xu et al., 2005) 。 
我 们 对 BmRT29_Kabuki 序列 进行 了 进一步 的 分 析 ， 
发 现 BmRT29 _ Kabuki 序列 中 包含 转 座 子 Bml 
(SINE) (Adams et al., 1986), BMC1, FUI 和 
Yokozuna ( Abe et al., 2000) , 而 Osanai-Futahashi 等 
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图 2 ”基于 逆转 录 转 座 酶 的 LTR 首 转 录 转 座 子 系统 发 生 分 析 ( Neighbor-Joining 法 ) 


Fig. 2 Neighbor-joining phylogenetic analysis of LTR retrotransposons based on reverse transcriptase 
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各 序列 的 来 源 及 GenBank 登录 号 依次 为 The origin and GenBank accession numbers of these sequences are as follows: CsRn1_CS; FERIR H 
Clonorchis sinensis, AY013569; gypsy_ DM: 黑 腹 果 晶 D. melanogaster, AF033821; ZAM_DM: $H Rig D. melanogaster, AJ000387; TED_TN : 
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WRR D. melanogaster, X95908; Cerl_CE: 秀丽 隐 杆 线虫 Caenorhabditis elegans, U15406; mdgl1_DM; $H Rte D. melanogaster, X59545 ; 
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Woot_TC: IMAX Tribolium castaneum, U09586; osvaldo_DB: 布 扎 绳 果 刚 Drosophila buzzatii, AJ133521; Gulliver_SJ: 日 本 血吸虫 Schistosoma 
japonicum, AF243513; MOSCOPIA_AA: R KAFEN Aedes aegypti, AF134899; copia_DM: $A 20h D. melanogaster, X04456 ; 1731_DM: WJA RIE 
D. melanogaster, X07656; ninja_DS; #58 Drosophila simulans, AB042129; BEL_DM; BES RB D. melanogaster, U23420; roo_DM: PLS EIB 
D. melanogaster, AY180917; BELI2_AG: P] HEER Anopheles gambiae, CAJ14165; Moose_AG: 四 比 亚 按 蚊 A. gambiae, AF060859. 图 3 同 


The same for Fig. 3. 
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图 3 ”基于 逆转 录 转 座 酶 的 Gypsy 超 家 族 系统 发 生 分 析 ( Neighbor-Joining 法 ) 


Fig. 3 Neighbor-joining phylogenetic analysis of Gypsy superfamily based on reverse transcriptase 





图 4 RE LTR 逆转 录 转 座 子 各 家 族 的 插 和 时间 估计 


Fig. 4 The estimates of insertion time of LTR retrotransposon families 
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图 5 部 分 LTR 逆转 录 转 座 子 家 族 在 5 龄 第 3 RAR HE AA RATS 


Fig. 5 Expression profiles of some LTR retrotransposon families in different tissues of day-3 5th instar larva of Bombyx mori 
1; H Ovary; 2: 精 梨 Testis; 3; $ Head; 4; 丝 腺 Silk glands; 5: 中 肠 Midgut; 6: 血液 Hemolymph; 7: 5 4 Malpighian tubules; 8: 脂肪 体 


Hemolymph body. Control; 阴性 对 照 Negative control (RNA). 


(2008 ) 的 结果 表明 , 仅 Bml 就 占 了 整个 基因 组 的 
11.4% > Xu 等 (2005 ) 误 把 基因 组 中 所 有 的 Bml Jy 
列 归 为 BmRT29_ Kabuki 的 拷贝 , 因此 , 过 高 地 佑 
计 了 LTR 逆转 录 转 座 子 在 家 和 在 基因 组 中 的 含量 。 

根据 全 长 LTR 逆转 录 转 座 子 两 端 LTR 的 分 化 
E, 对 家 看 中 每 个 LTR 逆转 录 转 座 子 家 族 的 插 人 时 
间作 了 近似 的 估计 , 结果 表明 , 绝 大 部 分 的 元 件 都 
是 最 近 插 入 到 基因 组 中 的 。 其 中 ,Gypsy-2_BM 家 
族 较为 特殊 , 它 的 拷贝 数 最 多 , 占 了 总 的 全 长 拷贝 
的 25% , 而且 估计 的 插入 时 间 分 布 于 不 同 区 间 内 ， 
这 表明 Gypsy-2_BM 家 族 在 不 同 的 进化 时 间 内 都 可 
能 有 活性 ,而 且 此 家 族 相 比 于 其 他 家 族 有 更 多 的 
EST 证 据 。 

38 个 家 族 中 ,26 个 家 族 有 EST 证 据 , 表明 这 
些 家 族 可 能 具有 湾 在 的 转录 活性 。 为 了 进一步 研究 
家 看 中 LTR 逆转 录 转 座 子 的 活性 , 我 们 在 3 个 超 家 
族 中 各 选取 拷贝 数 较 多 和 较 少 的 6 个 有 EST 证 据 
的 家 族 和 5 个 没有 EST 证 据 的 家 族 , 用 RT-PCR 做 
了 组 织 表 达 谱 分 析 ， 发 现 选 取 的 11 个 家 族 在 某 些 
组 织 中 有 表达 , 这 和 Xu 等 (2005) 的 结果 不 同 , 我 
们 用 作者 鉴定 的 24 个 家 族 搜索 现 有 的 EST 数据 
E, 发 现 有 16 个 家 族 有 EST 证 据 ， 而 当时 发 现 只 
有 1 个 家 族 有 EST 证据, 这 可 能 是 由 于 当时 的 EST 


数据 不 全 造成 的 。 无 EST 证 据 的 家 族 也 得 到 了 实 
验 的 证 实 , 这 也 说 明了 现 有 的 家 看 EST 序列 还 不 够 
全 面 。 基 于 此 , 我 们 推测 家 看 基因 组 中 的 大 部 分 
LTR 逆转 录 转 座 子 家 族 很 可 能 具有 潜在 活性 。 

在 Bel/Pao, Gypsy 和 Copia 3 个 超 家 族 中 ， 
Gypsy 家 族 在 昆虫 中 最 多 (Kapitonov and Jurka, 
2003; Tubio et al., 2004; Xu et al., 2005), 。 昆 虫 的 
Gypsy 超 家 族 可 以 分 为 6 个 校 , 分 别 为 : CsRnl, 
Gypsy, Mag, Mdgl, Mdg3 和 Osvaldo ( Tubio et al., 
2004 ) 。 果 晶 中 有 Gypsy, Mdgl, Mdg3 和 Osvaldo 4 
个 校 (Kapitonov and Jurka, 2003); KHE Eikii tÉ 
Gypsy, Mdg1 , Mdg3, CsRn1 和 Mag 5 44%; 家 至 中 
有 CsRn1, Gypsy, Mag 和 Mdg3 4 个 枝 ; 这 3 个 物种 
中 包 合 家 族 最 多 的 校 依次 是 Gypsy 校 (Kapitonov 
and Jurka, 2003), Mag #%( Tubio et al., 2004) ) 和 
CsRnl 校 。 不 同 校 在 不 同 物种 中 的 家 族 数 不 同 , 表 
明 在 不 同 物种 中 不 同 核 有 着 不 同 的 扩张 。 总 之 , 本 
研究 的 结果 提供 了 一 些 家 看 LTR 的 新 信息 , 将 有 助 
于 我 们 理解 逆转 录 转 座 子 在 昆虫 进化 中 的 作用 。 
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